Resumo

Problema

Uma campanha piloto foi realizada para testar a receptividade de um novo produto. O custo total da campanha foi de 6.720, enquanto a receita gerada pelos clientes que aderiram foi de 3.674, resultando em um retorno financeiro global negativo de -3.046. A taxa de conversão ficou em torno de 15%. Diante desse cenário, busca-se compreender melhor o perfil dos clientes que aceitaram a oferta, bem como otimizar a abordagem para a próxima campanha.

Objetivo/Entregáveis

  • Análise Exploratória:

    Investigar as principais variáveis e como elas se relacionam com a adesão à oferta.

  • Segmentação de Usuários:

    Agrupar clientes em perfis/segmentos para guiar ações mais direcionadas.

  • Modelo para a Próxima Campanha:

    Desenvolver um modelo para identificar clientes com maior probabilidade de aderir às ofertas, tendo como base o resultado financeiro.

Análise Exploratória

Esta seção tem como objetivo explorar os dados em maior profundidade e compreender a relação entre as variáveis e a adesão dos usuários à campanha.

Insights

Variável Insight
Escolaridade Quanto maior, maior a taxa de adesão.
Parceria Usuários sem parceiro aderem o dobro, mesmo sendo metade da amostra.
Estado civil Isoladamente, tem pouca relevância — o fator chave é ter ou não parceiro.
Filhos Mais filhos, menor adesão. Sem filhos = quase 3x mais chance de aderir.
Campanhas anteriores Já ter aderido aumenta em 4x a chance de nova adesão.
Reclamações Não influenciam o comportamento de adesão.
Renda Quanto maior, maior a chance de adesão.
Abandono Menor abandono, maior probabilidade de aderir.
Gastos Usuários que gastam mais aderem mais.
Compras Mais compras, maior adesão.
Visitas ao site Quantidade de visitas não afeta a adesão.

Gráficos (Adesão vs Principais Variáveis)

Variáveis Categóricas

Escolaridade

  • Há uma progressão clara entre o nível de escolaridade e a taxa de adesão à última campanha: quanto maior a escolaridade, maior a taxa de resposta.
  • O grupo com baixa escolaridade (Basic):
    • Menor amostra (54)
    • Menor taxa de adesão (3,7%)
  • O grupo com escolaridade média (2nd Cycle, Graduation):
    • Maior amostra (1.330)
    • Adesão intermediária (13%)
  • O grupo com escolaridade alta (Master, PhD):
    • Amostra intermediária (856)
    • Maior adesão (18,5%)
Escolaridade Agrupada
Escolaridade Detalhada

Estado Civil

  • Mais do que o estado civil isolado, o que realmente importa é se o usuário possui um parceiro ou não.
  • Usuários sem parceiro apresentam uma taxa de adesão duas vezes maior, mesmo representando apenas metade da amostra.
  • Grupo com parceiro (Married, Together):
    • Maior amostra (1.444)
    • Menor adesão (11%)
  • Grupo sem parceiro (Single, Divorced, Widow, Other):
    • Menor amostra (796)
    • Maior adesão (22%)
Flag de Solitude

0 = Tem parceiro
1 = Não tem parceiro

Estado Civil Completo

Filhos

  • Observa-se uma tendência inversa (embora não linear) entre o número de filhos e a taxa de adesão: quanto mais filhos, menor a probabilidade de aderir a uma nova campanha.
  • Usuários sem filhos têm quase 3 vezes mais chance de adesão em comparação aos que possuem filhos.
  • Grupo com filhos:
    • Maior amostra (1.602)
    • Menor adesão (10,3%)
  • Grupo sem filhos:
    • Menor amostra (638)
    • Maior adesão (26,5%)
Flag de Filhos

0 = Não tem filhos criança ou adolescente
1 = Tem filhos criança ou adolescente

Quantidade de Filhos

Campanhas Anteriores

  • Quanto maior o número de campanhas anteriores aderidas, maior o nível de fidelização do usuário e, consequentemente, sua chance de aderir a uma nova.
  • Usuários que já aderiram a pelo menos uma campanha anterior têm quatro vezes mais chance de adesão em comparação aos que nunca aderiram.
  • Grupo sem adesão anterior:
    • Maior amostra (1.777)
    • Menor adesão (8,2%)
  • Grupo com adesão anterior:
    • Menor amostra (463)
    • Maior adesão (40,6%)
Flag Adesão Anterior

0 = Não fez adesão em nenhuma campanha anteriormente
1 = Fez adesão em alguma campanha anteriormente

Aderência em Campanhas Anteriores

Reclamações

  • Não há significância estatística: o padrão de adesão entre quem reclamou é semelhante ao de quem não reclamou.

Variáveis Numéricas

Ano de Nascimento

  • Não há significância estatística: os públicos com e sem adesão seguem padrões similares.

Renda

  • O público com maior renda apresenta maior adesão às novas campanhas.
  • A maior concentração de pessoas está na faixa de renda entre 70.000 e 90.000.

Abandono

  • Usuários com menor tempo de abandono têm maior probabilidade de aderir a uma nova campanha.
  • A maior concentração está entre 0 e 20 dias de abandono.

Gastos

  • Usuários com maior volume de gastos têm maior probabilidade de aderir às campanhas em comparação aos que gastam menos.
  • Embora o público que adere esteja bem distribuído, a diferença em relação aos que não aderem se torna mais evidente a partir de 1.500 em gastos.

Compras

  • Usuários com maior número de compras têm uma probabilidade mais alta de aderir às campanhas, em comparação àqueles com menos compras.

Visitas Web

  • A probabilidade de adesão às campanhas é semelhante entre usuários com diferentes quantidades de visitas ao site.

Segmentação de Usuários

Esta seção tem como objetivo segmentar o público da campanha piloto, a fim de entender melhor os perfis de usuários que temos.

Para entender melhor os perfis de usuários, aplicamos uma segmentação via K-Means, utilizando variáveis-chave como renda, tempo desde a última compra, total gasto, número de compras, além de flags demográficas e de engajamento. O método do cotovelo indicou 2 clusters ideais.

Públicos identificados

Cluster 0 – Engajados / Jovens

  • 22,4% de adesão a campanhas
  • Menor renda, menos filhos, maior engajamento e visitas ao site
  • Perfil mais aberto a novas campanhas, apesar de menor poder de compra

Cluster 1 – Desengajados / Estáveis

  • 9,1% de adesão
  • Maior renda, mais filhos, menos engajamento com campanhas
  • Apesar do maior gasto total, são menos responsivos e visitam menos o site

Gráficos (Clusters vs Principais Variáveis)

Variáveis Categóricas

Variáveis Numéricas

Modelo para a Próxima Campanha

Esta seção tem como objetivo identificar, com base nos dados da campanha piloto, os usuários que possuem maior potencial de retorno financeiro se forem contatados na próxima campanha.

Para isso, desenvolvemos um modelo preditivo utilizando regressão logística, com as mesmas variáveis utilizadas na segmentação (renda, recência, total gasto, número de compras, e variáveis demográficas e de engajamento).

Após o treinamento do modelo, identificamos que o threshold que maximiza o lucro é de 0,46. Ele nos dá um lucro de 187 com 66 contatos.

Conclusão

A partir dos modelos que construímos, temos dois caminhos possíveis:

  1. Segmentação:

    Usar o perfil engajado da segmentação e criar uma campanha personalizada para esse grupo.
    O problema é que, ao simular o reenvio da campanha piloto para esse público, o resultado seria um prejuízo de 519.

  2. Maior Lucro:

    Usar o público filtrado pelo modelo de regressão logística (com threshold ≥ 0,46) e reenviar a campanha piloto.
    Essa opção é mais segura, com lucro estimado de 187, mas com um público pequeno (66 pessoas).

Estratégia Base usada Nº de Contatos Taxa de Adesão (%) Receita (R$) Custo (R$) Lucro Líquido (R$)
0 Segmentação Cluster Engajado 976 22.44 2409 2928 -519
1 Maior Lucro Threshold ≥ 0.46 66 53.03 385 198 187

Proposta

Manter a campanha piloto, mas realizar um teste A/B para comparar a eficácia do modelo preditivo na seleção do público-alvo.

  • Controle:

    Enviar a campanha para um grupo aleatório de usuários, como foi feito originalmente.

  • Modelo:

    Enviar a campanha apenas para os usuários selecionados pelo modelo preditivo (threshold ≥ 0,46), que têm maior probabilidade de adesão.

Como métrica principal, utilizaremos o lucro obtido. Além disso, também acompanharemos a taxa de conversão, a receita gerada e o custo da campanha como métricas de apoio.

Fazer dessa forma é interessante, pois poderemos validar, com novos casos, se o modelo de fato entrega melhores resultados.